期刊
  出版年
  关键词
结果中检索 Open Search
Please wait a minute...
选择: 显示/隐藏图片
1. 基于改进的旋转森林算法的不平衡网络流量分类方法
丁要军
计算机应用    2015, 35 (12): 3348-3351.   DOI: 10.11772/j.issn.1001-9081.2015.12.3348
摘要599)      PDF (611KB)(450)    收藏
针对不平衡网络流量分类精度不高的问题,在旋转森林算法的基础上结合Bagging算法的Bootstrap抽样和基于分类精度排序的基分类器选择算法,提出一种改进的旋转森林算法。首先,对原始训练集按特征进行子集划分并分别使用Bagging进行样本抽样,通过主成分分析(PCA)生成主成分系数矩阵;然后,在原始训练集和主成分系数矩阵的基础上进行特征转换,生成新的训练子集,再次使用Bagging对子集进行抽样,提升训练集的差异性,并使用训练子集训练C4.5基分类器;最后,使用测试集评价基分类器,依据总体分类精度进行排序筛选,保留分类精度较高的分类器并生成一致分类结果。在不平衡网络流量数据集上进行测试实验,依据准确率和召回率两个标准对C4.5、Bagging、旋转森林和改进的旋转森林四种算法评价,依据模型训练时间和测试时间评价四种算法的时间效率。实验结果表明改进的旋转森林算法对万维网(WWW)协议、Mail协议、Attack协议、对等网(P2P)协议的分类准确度达到99.5%以上,召回率也高于旋转森林、Bagging、C4.5三种算法,可用于网络入侵取证、维护网络安全、提升网络服务质量。
参考文献 | 相关文章 | 多维度评价
2. GPU OpenFlow海量数据网络处理模型——GOMDI
张伟 解争龙 丁要军 张潇晓
计算机应用    2014, 34 (8): 2243-2247.   DOI: 10.11772/j.issn.1001-9081.2014.08.2243
摘要462)      PDF (840KB)(398)    收藏

OpenFlow的出现提高了现有网络的服务质量(QoS),但在处理海量数据时存在网络会话识别效率低、网络报文转发路径不佳等缺点。在OpenFlow的研究基础上,提出了海量网络数据处理(GOMDI)模型,通过将GPU并行计算、生物序列算法和机器学习方法相融合,设计出GOMDI网络会话匹配算法和路径选择算法。实验结果表明,GOMDI网络会话匹配算法与CPU环境相比加速比提升了近300;路径选择算法中网络丢包率低于5%,网络延时小于20ms。因此,GOMDI模型可有效地提升网络性能,满足大数据环境下实时处理海量信息的需求。

参考文献 | 相关文章 | 多维度评价
3. 基于互信息选择聚类集成的网络流量分类方法
丁要军 蔡皖东
计算机应用    2013, 33 (01): 80-82.   DOI: 10.3724/SP.J.1087.2013.00080
摘要1088)      PDF (602KB)(619)    收藏
针对互联网流量标注困难以及单个聚类器的泛化能力较弱,提出一种基于互信息(MI)理论的选择聚类集成方法,以提高流量分类的精度。首先计算不同初始簇个数K的K均值聚类结果与训练集中流量协议的真实分布之间的规范化互信息(NMI);然后基于NMI的值来选择用于聚类集成的K均值基聚类器的K值序列;最后采用二次互信息(QMI)的一致函数生成一致聚类结果,并使用一种半监督方法对聚类簇进行标注。通过实验比较了聚类集成方法与单个聚类算法在4个不同测试集上总体分类精度。实验结果表明,聚类集成方法的流量分类总体精度能达到90%。所提方法将聚类集成模型应用到网络流量分类中,提高了流量分类的精度和在不同数据集上的分类稳定性。
参考文献 | 相关文章 | 多维度评价